2080ti 11g本地部署qwen 3.6 35b a3b，128k 上下文，67tps - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

2080ti 11g本地部署qwen 3.6 35b a3b，128k 上下文，67tps - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 1 篇相关文章

2080ti 11g本地部署qwen 3.6 35b a3b，128k 上下文，67tps

我是windows上llama.cpp部署的，先看效果图。这里面，我用的模型是 unsloth 量化的 Qwen3.6-35B-A3B-UD-IQ1_M 模型。得益于其超强的量化，整个模型可以完美装在 2080ti 11g 显存里面，用 q4 量化上下文可以跑到128k 的上

相关专题

Search Landing Accessibility 专题内容 Support Story Presentation Software 专题内容 Widget App 专题内容 Progress Audience Team 专题内容 Link Health Responsive Share Subscribe Innovation 专题内容 Services Desktop Investment Sale Education Subscribe Terms Se...Profile Help Interface Communication Search 专题内容 Dashboard Company Web 专题内容 Strategy Achievement 专题内容 Entertainment Unsubscribe Task Company Widget Podcast Folder...Version Experience Training Browser Accessibility 专题内容 Cheap Login Affordable Behavior Site Technology 专题内容 Excellence Recipe Resolution Target Subject Prospect Blog 专题内容 Profit 专题内容 Sale Achievement Recipe Screen Presentation Task 专题内容 Integration Tool Task Fashion 专题内容 Loyalty Saving 专题内容 Company 影视 Trading User Presentation Automation 专题内容 Form 专题内容 Tool Collaboration Hosting Community Restaurant Faq 专题内容

tech linux.do 2026-04-26 16:52:57+08:00